常見的資料分析流程如下:
圖片來源:https://www.flaticon.com/
資料描述 (Data exploration)
數據清理 (Data cleaning)
由於資料在產生或蒐集時可能會造成資料格式錯誤或資料遺失等問題,因此在進行分析前,需透過數據清理做好前置作業,以確保後續的分析之正確性。
資料前處理(Data preprocessing)
在建立預測模型之前,可能會碰到資料不平衡的問題、不同欄位之間是否可以進行比較等相關問題。在穿戴式裝置資料中,根據裝置設計的不同,每一秒所紀錄的資料點亦有不同,因此為了減少資料雜訊,也有需多人會使用平滑法(smoothing)來處理資料。
訓練/測試
根據所制定的目標,挑選所要使用的統計模型、機器學習模型、深度學習模型等,並使用資料進行訓練
結果解讀
不同的模型具有不同的可解釋性,可解釋性的模型除了可獲得分類結果外,亦可得知變數重要性等訊息,因此可針對變數進行更多的結果